强化学习行为套件 | David Silver___XiaoMi-AI 助力科研平台

强化学习行为套件 | David Silver

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

强化学习行为套件 | David Silver

¥ 1.0

热度

本文介绍了强化学习行为套件（简称 bsuite）。bsuite 是一组经过精心设计的实验，旨在研究强化学习 (RL) 代理的核心功能，其目标有两个。首先，收集清晰、信息丰富且可扩展的问题，这些问题可以捕捉通用高效学习算法设计中的关键问题。其次，通过代理在这些共享基准上的表现来研究代理行为。为了补充这项工作，我们开源了 github.com/deepmind/bsuite，它可以自动评估和分析 bsuite 上的任何代理。这个库有助于对 RL 中的核心问题进行可重复和可访问的研究，并最终设计出更优秀的学习算法。我们的代码是 Python，易于在现有项目中使用。我们提供了 OpenAI Baselines、Dopamine 以及新参考实现的示例。展望未来，我们希望纳入更多来自研究界的优秀实验，并承诺由著名研究人员组成的委员会定期审查 bsuite。

添加pdf代下载 VIP点击下载文件